apache sparkSEARCH AGGREGATION

首页/精选主题/

apache spark

托管Hadoop集群

...基于 Hadoop 框架的大数据综合处理平台,提供开箱即用的 Spark、HBase、Presto、Hive 等大数据生态常见组件,同时可选 Hue、Sqoop、Oozie、Pig 等多种辅助工具。 为满足存储计算分离的需求,UHadoop 现已支持独立管理的 HDFS 存储集群,可...

apache spark问答精选

Spark和Hadoop对于大数据的关系?

回答:Hadoop生态Apache™Hadoop®项目开发了用于可靠,可扩展的分布式计算的开源软件。Apache Hadoop软件库是一个框架,该框架允许使用简单的编程模型跨计算机集群对大型数据集进行分布式处理。 它旨在从单个服务器扩展到数千台机器,每台机器都提供本地计算和存储。 库本身不是设计用来依靠硬件来提供高可用性,而是设计为在应用程序层检测和处理故障,因此可以在计算机集群的顶部提供高可用性服务,...

娣辩孩 | 1447人阅读

大数据Spark技术是否可以替代Hadoop?

回答:1998年9月4日,Google公司在美国硅谷成立。正如大家所知,它是一家做搜索引擎起家的公司。无独有偶,一位名叫Doug Cutting的美国工程师,也迷上了搜索引擎。他做了一个用于文本搜索的函数库(姑且理解为软件的功能组件),命名为Lucene。左为Doug Cutting,右为Lucene的LOGOLucene是用JAVA写成的,目标是为各种中小型应用软件加入全文检索功能。因为好用而且开源(...

ctriptech | 774人阅读

apache怎么支持php

问题描述:关于apache怎么支持php这个问题,大家能帮我解决一下吗?

张迁 | 727人阅读

apache如何禁止访问目录

问题描述:关于apache如何禁止访问目录这个问题,大家能帮我解决一下吗?

阿罗 | 944人阅读

phpnow如何重启apache

问题描述:关于phpnow如何重启apache这个问题,大家能帮我解决一下吗?

张宪坤 | 617人阅读

apache spark精品文章

  • Spark SQL学习笔记

    ...text // 假设已经有一个 SparkContext 对象 val sqlContext = new org.apache.spark.sql.SQLContext(sc) // 用于包含RDD到DataFrame隐式转换操作 import sqlContext.implicits._ 对于2.0版本以后,入口变成了SparkSession,使用SparkSession.builder...

    qieangel2013 评论0 收藏0
  • Spark学习笔记之相关记录

    编程指南:http://spark.apache.org/docs/... ApiDoc: http://spark.apache.org/docs/... 0、例子 http://spark.apache.org/examp... 1、集群模式与如何部署? 集群模式:http://spark.apache.org/docs/... 提交部署应用:http://spark.apache....

    daydream 评论0 收藏0
  • Spark 』5. 这些年,你不能错过的 spark 学习资源

    ...中打开图片,查看原图哦。 1. 书籍 Learning Spark Mastering Apache Spark 2. 网站 official site user mailing list spark channel on youtube spark summit meetup spark third party packages databricks blog databricks ...

    mist14 评论0 收藏0
  • 什么是CDH Spark2

       CDH 包括除 Apache Hadoop 之外的许多其他开源工具和技术,例如 Apache Spark,它是一种用于大规模数据处理的快速灵活的数据处理引擎。  CDH Spark2 是 Apache Spark 的一个版本,包含在 Cloudera Distribution for Apa...

    白马啸西风 评论0 收藏0
  • IntelliJ IDEA Windows下Spark开发环境部署

    ...ctionUtil类 在srcmainjava目录下新建java类ConnectionUtil import org.apache.spark.SparkConf; import org.apache.spark.api.java.JavaSparkContext; public class ConnectionUtil { public static final String ...

    DevWiki 评论0 收藏0
  • Leaf in the Wild: Stratio整合Apache和MongoDB为世界上最大的银行

    ...:http://www.mongoing.com/blog/post/leaf-in-the-wild-stratio-integrates-apache-spark-and-mongodb-to-unlock-new-customer-insights-for-one-of-worlds-largest-banks欢迎关注MongoDB中文社区获取更多关于MongoDB的信息。 毫无疑问,...

    BDEEFE 评论0 收藏0
  • Spark SQL知识点与实战

    ...la> val df = spark.read.json(/opt/module/spark-local/people.json)df: org.apache.spark.sql.DataFrame = [age: bigint, name: string]2)对DataFrame创建一个临时表scala> df.createOrReplaceTempView(people)3)通过SQL语...

    番茄西红柿 评论0 收藏2637
  • Spark SQL知识点大全与实战

    ...la> val df = spark.read.json(/opt/module/spark-local/people.json)df: org.apache.spark.sql.DataFrame = [age: bigint, name: string]2)对DataFrame创建一个临时表 scala> df.createOrReplaceTempView(people)3)通过SQ...

    番茄西红柿 评论0 收藏2637
  • PySpark SQL 相关知识介绍

    ...序。 MapReduce算法有很多用途。如许多机器学习算法都被Apache Mahout实现,它可以在Hadoop上通过Pig和Hive运行。 但是MapReduce并不适合迭代算法。在每个Hadoop作业结束时,MapReduce将数据保存到HDFS并为下一个作业再次读取数据。我们知...

    CoderStudy 评论0 收藏0
  • Spark 快速入门

    Spark Spark 背景 什么是 Spark 官网:http://spark.apache.org Spark是一种快速、通用、可扩展的大数据分析引擎,2009年诞生于加州大学伯克利分校AMPLab,2010年开源,2013年6月成为Apache孵化项目,2014年2月成为Apache顶级项目。目前,Spark...

    wangshijun 评论0 收藏0
  • Spark Streaming 到 Apache Flink : 实时数据流在爱奇艺的演进

    作者:陈越晨 整理:刘河 本文将为大家介绍Apache Flink在爱奇艺的生产与实践过程。你可以借此了解到爱奇艺引入Apache Flink的背景与挑战,以及平台构建化流程。主要内容如下: 爱奇艺在实时计算方面的的演化和遇到的一些挑...

    econi 评论0 收藏0

推荐文章

相关产品

<